home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9701 / 000015_owner-urn-ietf _Wed Jan 29 12:56:51 1997.msg < prev    next >
Internet Message Format  |  1997-02-19  |  10KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id MAA03172 for urn-ietf-out; Wed, 29 Jan 1997 12:56:51 -0500
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id MAA03167 for <urn-ietf@services.bunyip.com>; Wed, 29 Jan 1997 12:56:47 -0500
  3. Received: from josef.ifi.unizh.ch by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA05847  (mail destined for urn-ietf@services.bunyip.com); Wed, 29 Jan 97 12:56:30 -0500
  5. Received: from enoshima.ifi.unizh.ch by josef.ifi.unizh.ch with SMTP (PP) 
  6.           id <08248-0@josef.ifi.unizh.ch>; Wed, 29 Jan 1997 18:48:36 +0100
  7. Date: Wed, 29 Jan 1997 18:48:35 +0100 (MET)
  8. From: "Martin J. Duerst" <mduerst@ifi.unizh.ch>
  9. To: URL mailing list <ietf-url@imc.org>, urn-ietf@bunyip.com
  10. Subject: Re: [URN] what's in a syntax? (fwd)
  11. Message-Id: <Pine.SUN.3.95q.970129183825.245H-100000@enoshima>
  12. Mime-Version: 1.0
  13. Content-Type: TEXT/PLAIN; charset=US-ASCII
  14. Sender: owner-urn-ietf@services.bunyip.com
  15. Precedence: bulk
  16. Reply-To: "Martin J. Duerst" <mduerst@ifi.unizh.ch>
  17. Errors-To: owner-urn-ietf@bunyip.com
  18.  
  19. The following is a mail I sent to Leslie regarding her request
  20. on the URN list. I am posting it now, as mentionned before,
  21. because I think that it gives some more background to some
  22. things currently discussed about URNs and URLs. Not that
  23. I think that the things I discuss here should be realized
  24. immediately, though.
  25.  
  26. Regards,    Martin.
  27.  
  28. ---------- Forwarded message ----------
  29. Date: Tue, 28 Jan 1997 10:01:53 +0100 (MET)
  30. From: "Martin J. Duerst" <mduerst@ifi.unizh.ch>
  31. To: Leslie Daigle <leslie@bunyip.com>
  32. Subject: Re: [URN] what's in a syntax?
  33.  
  34. On Mon, 27 Jan 1997, Leslie Daigle wrote:
  35.  
  36. > It seems to me that we are at a crossroads with the URN syntax, and we need to 
  37. > get some concrete sense of direction quickly.
  38. > I'd like to outline the situation below and then ask for everyone to send
  39. > feedback to me directly -- and please, do send feedback, if only to let me
  40. > know people are still thinking about this :-)
  41.  
  42. Hello Leslie,
  43.  
  44. I'm definitely still caring about it, although my main concern is
  45. internationalization. Even for this, the syntactic parallels between
  46. URLs and URNs are important, whereas semantically (e.g. why do we
  47. need internationalization), there are wide differences.
  48.  
  49.  
  50. > Ryan, our URN syntax document editor, has spent a good deal of time trying
  51. > to get URN syntax to line up reasonably well with the existing URL syntax
  52. > document (i.e., the de facto "URI" syntax document).
  53. > This document is currently under review, and there are efforts afoot to 
  54. > determine a review process for vetting new URL schemes. 
  55. > As part of the discussion of this (on the uri@bunyip.com mailing list),
  56. > the issue of URN conformance with URL syntax has come up.  There are some
  57. > specific changes that would (still) have to be made to accomplish this.
  58. > While these are not necessarily stressing in terms of syntax, there
  59. > are some particular ramifications that need to be considered:
  60. >     . If we align the syntaxes wrt reserved characters, etc, will
  61. >       
  62. >         URN:<see syntax draft of the day>
  63. >       necessarily imply that URNs are a "scheme" of URLs?
  64.  
  65. No, URNs are not, and should not be, a special scheme. They are on
  66. par with URLs. But syntactically, they look like a (not so) special
  67. scheme, and this has many advantages. And they might be processed
  68. by many browsers like a scheme, i.e. look at part before first ":",
  69. decide which subroutine to call, and pass the rest to this subroutine.
  70.  
  71.  
  72. >       If so, then URNs will have to go through the URL vetting process,
  73. >       and potentially the string "URN" will be objected to.
  74.  
  75. No, URNs are one level higher.
  76.  
  77. >       Also, will this imply that URNs are equivalent to URLs in terms
  78. >       of semantics?  (There are those that think the are, and those that
  79. >       think they aren't). 
  80.  
  81. That's not my field of expertise, but I think finally, usage will
  82. show it. In some sense, they are similar (you get something back if
  83. you type it into a browser), in some sense, they are hopefully different
  84. (persistency,...).
  85.  
  86.  
  87. >     . Alternatively, can we align the syntaxes and succeed in having
  88. >       
  89. >         URN:<see syntax draft of the day>
  90. >       treated as a special case by URL resolvers, (treated as an 
  91. >       opaque URL, as Ryan described it).
  92.  
  93. An opaque URL, in terms of URLs, is nothing special. A lot of URLs
  94. are opaque URLs, such as "mailto" or "data". URNs conform to URL
  95. syntax. They just don't conform to the syntax for generic URLs,
  96. but that's not necessary.
  97.  
  98. The question might arise whether relative addressing of URNs is
  99. necessary or desirable. The way I see URNs, their persistency
  100. implies that they are rather big and independent, so that
  101. relative addressing is not of much use. One of the scenarios
  102. I see is that an URN (e.g. for a book) is resolved to an URL
  103. that is the top of the hypertext structure that actually
  104. represents that book, and that that hypertext structure
  105. is internally linked using relative URLs.
  106.  
  107. This may lead to the question whether we need a way to not only
  108. say "book X" (with urn:isbn:0-12345678-9) but "paragraph m on page n
  109. of chapter y". There would be no need for such things to use
  110. relatively, as other means can be used for addressing inside
  111. a document, and as the main advantage of relative addressing,
  112. invariance under coordinated movement to another place, is
  113. irrelevant because URNs don't change if the actual resource
  114. is moved to another place. But still, the requirement of
  115. addressing a point inside an URN may remain.
  116.  
  117. The problem is that such addressing can be done in many different
  118. ways (pages vs. chapters and sections, or seconds for a video,...).
  119. The #name feature looks promising, but it restricts references
  120. to only those places that have been tagged beforehand, not a
  121. good thing for maybe very bulky documents.
  122.  
  123. What I think is worth contemplating, if not already done, are
  124. ways to identify locations inside an URN. This is quite an
  125. architectural question, because we might require that
  126. URN resolvers resolve locations inside a resource at the
  127. same time they resolve the URN itself, or that it is just
  128. something done syntactically. In the first case, an URN
  129.     urn:isbn:0-12345678-9=page34line20
  130. would be passed as
  131.     0-12345678-9=page34line20
  132. to some isbn resolver, which, maybe with the help of other
  133. resolvers, could return an URL such as
  134.     http://xxx.yyy.lib/books/shelfNN/ourBook/chapter3/section2#anchor
  135. which might be the closest identifiable point to line 20 on page 34.
  136. The alternative would be to have an URN
  137.     urn:isbn:0-12345678-9=/chapter3/section2#anchor
  138. which would be chopped apart either by the URN software or an
  139. isbn resolver (depending on whether a generic syntax is choosen
  140. or not). The resolving process would then return only
  141.     http://xxx.yyy.lib/books/shelfNN/ourBook
  142. and the client would append
  143.     /chapter3/section2#anchor
  144. to get the same result. In the above, the fact that the first example
  145. uses lines and pages should not give the impression that this variant
  146. is more oriented towards physical location; the important thing is
  147. that it (potentially) allows various addressing modalities and
  148. transformation from one modality to another. The character "=" has
  149. been choosen just as an example. If we decide that addressing
  150. inside a resource is a desired syntactical property of (potentially)
  151. all URNs and that it should be handled syntactically (i.e. by
  152. string concatenation with the resulting URL, with all the problems
  153. of non-portability), then it might become "#". If URN resolvers
  154. are responsible for this part also, there is no need for a convention,
  155. although it is not bad to have an informal one. The main problem
  156. in this case is that URN schemes have to plan for such things
  157. in advance; it is difficult to start with an "isbn" scheme
  158. without such a feature and later add one. There is also the
  159. danger of fragmentation, i.e. from an isbn scheme, somebody
  160. might create an isbnpageline scheme, whereas somebody else
  161. might create an isbnchaptsect scheme. If done with enough
  162. foresight, this is of course not necessessary, because
  163.     urn:isbn:0-12345678-9=page34line20
  164. and
  165.     urn:isbn:0-12345678-9=chapt2sect3
  166. (which in both cases would need a little bit more of syntax after
  167. the "=") can both coexist.
  168.  
  169.  
  170. > These questions have little to do with implementation details -- i.e., 
  171. > any of the above can certainly be implemented.  The real questions, to my
  172. > way of thinking, lie in:
  173. >     . Does lining up the syntaxes increase the likelihood of getting
  174. >       URNs handled sooner rather than later by existing software (i.e.,
  175. >       are the necessary differences in handling going to mean that
  176. >       existing software can't handle them anyway?)
  177.  
  178. The syntaxes are already lined up (apart from internationalization issues).
  179.  
  180. >     . What issues will we have to address in terms of 
  181. >       supporting/distinguishing URN/URL semantics?  (E.g., if URNs
  182. >       are supported as URL "schemes",  can we make the distinction
  183. >       between names and addresses).
  184. > I have not been successful in trying to make this an even-handed message -- it
  185. > is pretty clear that I am concerned that we are heading back into rough
  186. > waters regarding "why do we need URNs when we have URLs".  _However_, I 
  187. > know there are other people who have seen all of this and think that there
  188. > is no real issue at all.
  189.  
  190. The rough question might be "do we need some mechanism to identify
  191. 'locations' inside a resource".
  192.  
  193.  
  194. > So, please send feedback -- if you think there is an issue here, and why, or
  195. > if you think there is no issue here, and why not.  Please send directly
  196. > to me -- I will summarize for the list, and make the collected messages
  197. > available.  
  198.  
  199. It turns out that I have written a lot here. If you think that it
  200. makes sense to send this directly to the list for further
  201. discussion, please do so or tell me to do so.
  202.  
  203.  
  204. Regards,    Martin.
  205.  
  206.